\section{矩阵的分块}

\begin{frame}{矩阵的分块}
在这一节，我们来介绍一个在处理阶数较高的矩阵时常用的方法， 即矩阵的分块。有时候，我们把一个大矩阵看成是由一些小矩阵组成的， 就如矩阵是由数组成的一样。特别在运算中， \emph{把这些小矩阵当作数一样来处理}。 这就是所谓矩阵的\emph{分块}。

\pause
%为了说明这个方法，下面看一个例子。在矩阵
\begin{example}
令
\[
  A=\left(\begin{array}{rr|rr}
    1 & 0 & 0 & 0 \\
  0 & 1 & 0 & 0 \\
\hline
-1 & 2 & 1 & 0 \\
1 & 1 & 0 & 1
\end{array}\right)=\begin{pmatrix}
   E_{2} & O \\
 A_{1} &  E_{2}
\end{pmatrix}, \quad 
\pause
 B=\left(\begin{array}{rr|rr}
    1 & 0 & 3 & 2 \\
  -1 & 2 & 0 & 1 \\
\hline 
1 & 0 & 4 & 1 \\
-1 & -1 & 2 & 0
\end{array}\right)=\begin{pmatrix}
   B_{11} &  B_{12} \\
 B_{21} &  B_{22}
\end{pmatrix},
\]
其中$ E_{2}$ 表示 $2$ 阶单位矩阵， 而
\[
\begin{gathered}
   A_{1}=\begin{pmatrix}
    -1 & 2 \\
  1 & 1
\end{pmatrix}, \quad  O=\begin{pmatrix}
  0 & 0 \\
0 & 0
\end{pmatrix},\\
\pause
   B_{11}=\left(\begin{array}{rr}
    1 & 0 \\
  -1 & 2
\end{array}\right), \quad  B_{12}=\left(\begin{array}{ll}
  3 & 2 \\
0 & 1
\end{array}\right), \quad  B_{21}=\left(\begin{array}{rr}
  1 & 0 \\
-1 & -1
\end{array}\right), \quad  B_{22}=\left(\begin{array}{ll}
  4 & 1 \\
2 & 0
\end{array}\right) .
\end{gathered}
\]
\end{example}
\end{frame}

\begin{frame}
  \addtocounter{theorem}{-1}
\begin{example}[续]
在计算 $ A B$ 时，把 $ A,  B$ 都看成是由这些小矩阵组成的，即按 $2$ 阶矩阵来运算。
\pause
于是
\[
   A  B=\begin{pmatrix}
       E_{2} &  O \\
       A_{1} &  E_{2}
    \end{pmatrix}\begin{pmatrix}
       B_{11} &  B_{12} \\
     B_{21} &  B_{22}
  \end{pmatrix}=\begin{pmatrix}
     B_{11} &  B_{12} \\
   A_{1}  B_{11}+ B_{21} &  A_{11}  B_{12}+ B_{22}
\end{pmatrix},
\]
其中
\[
  \begin{aligned}
       A_{1}  B_{11}+ B_{21} & =\begin{pmatrix}
            -1 & 2 \\
              1 & 1
            \end{pmatrix}\begin{pmatrix}
              1 & 0 \\
            -1 & 2
          \end{pmatrix}+\begin{pmatrix}
            1 & 0 \\
          -1 & -1
      \end{pmatrix} 
    %\\
    %& =\begin{pmatrix}
    %  -3 & 4 \\
    %0 & 2
    %\end{pmatrix}+\begin{pmatrix}
    %  1 & 0 \\
    %-1 & -1
    %\end{pmatrix}
      =\begin{pmatrix}
        -2 & 4 \\
      -1 & 1
  \end{pmatrix}, \\
  A_{1}  B_{12}+ B_{22} & =\begin{pmatrix}
    -1 & 2 \\
  1 & 1
\end{pmatrix}\begin{pmatrix}
  3 & 2 \\
0 & 1
\end{pmatrix}+\begin{pmatrix}
  4 & 1 \\
2 & 0
\end{pmatrix} 
%\\
%& =\begin{pmatrix}
%  -3 & 0 \\
%3 & 3
%\end{pmatrix}+\begin{pmatrix}
%  4 & 1 \\
%2 & 0
%\end{pmatrix}
=\begin{pmatrix}
  1 & 1 \\
5 & 3
\end{pmatrix} .
\end{aligned}
\]
\pause
因此
\[
   A B=\begin{pmatrix}
      1 & 0 & 3 & 2 \\
      -1 & 2 & 0 & 1 \\
    -2 & 4 & 1 & 1 \\
  -1 & 1 & 5 & 3
\end{pmatrix}.
\]
不难验证， 直接按 $4$ 阶矩阵乘积的定义来做， 结果是一样的。
\end{example}
\end{frame}

\begin{frame}{分块矩阵的运算}
一般地说， 设 $ A=\left(a_{i k}\right)_{s \times n},  B=\left(b_{k j}\right)_{n \times m}$, 在$A, B$的一些行间和列间插入直线把 $ A,  B$ 分成一些小矩阵
\[
  A = \raisebox{-1cm}{\begin{tikzpicture}
  \matrix (m) [matrix of math nodes, ampersand replacement=\&, left delimiter=(,right delimiter=)]
    {
       A_{11} \&  A_{12} \& \cdots \&  A_{1 l} \\
       A_{21} \&  A_{22} \& \cdots \&  A_{2 l} \\
      \vdots \& \vdots \& \& \vdots \\
       A_{t 1} \&  A_{t 2} \& \cdots \&  A_{t l} \\
    };
    \node [above=of m-1-1,yshift=-3em] (m11) {$n_1$};
    \node [above=of m-1-2,yshift=-3em] (m12) {$n_2$};
    \node [above=of m-1-3,yshift=-2.5em] (m13) {$\cdots$};
    \node [above=of m-1-4,yshift=-3em] (m14) {$n_{l}$};
    \node [left=of m-1-1,xshift=2em] (m11) {$s_1$};
    \node [left=of m-2-1,xshift=2em] (m11) {$s_2$};
    \node [left=of m-3-1,xshift=1em] (m11) {$\vdots$};
    \node [left=of m-4-1,xshift=2em] (m11) {$s_{t}$};
\end{tikzpicture}},\quad
\pause
  B = \raisebox{-1cm}{\begin{tikzpicture}
  \matrix (m) [matrix of math nodes, ampersand replacement=\&, left delimiter=(,right delimiter=)]
    {
       B_{11} \&  B_{12} \& \cdots \&  B_{1r} \\
       B_{21} \&  B_{22} \& \cdots \&  B_{2 r} \\
      \vdots \& \vdots \& \& \vdots \\
       B_{l 1} \&  B_{l 2} \& \cdots \&  B_{lr} \\
    };
    \node [above=of m-1-1,yshift=-3em] (m11) {$m_1$};
    \node [above=of m-1-2,yshift=-3em] (m11) {$m_2$};
    \node [above=of m-1-3,yshift=-2.5em] (m11) {$\cdots$};
    \node [above=of m-1-4,yshift=-3em] (m11) {$m_{r}$};
    \node [left=of m-1-1,xshift=2em] (m11) {$n_1$};
    \node [left=of m-2-1,xshift=2em] (m11) {$n_2$};
    \node [left=of m-3-1,xshift=1em] (m11) {$\vdots$};
    \node [left=of m-4-1,xshift=2em] (m11) {$n_{l}$};
\end{tikzpicture}}.
\]
其中每个 $ A_{i j}$ 是 $s_{i} \times n_{j}$ 小矩阵， 每个 $ B_{i j}$ 是 $n_{i} \times m_{j}$ 小矩阵。
\pause
那么有
\[\tag{3}
  AB = \raisebox{-1cm}{\begin{tikzpicture}
  \matrix (m) [matrix of math nodes, ampersand replacement=\&, left delimiter=(,right delimiter=)]
    {
       C_{11} \&  C_{12} \& \cdots \&  C_{1r} \\
       C_{21} \&  C_{22} \& \cdots \&  C_{2r} \\
      \vdots \& \vdots \& \& \vdots \\
       C_{t 1} \&  C_{t 2} \& \cdots \&  C_{tr} \\
    };
    \node [above=of m-1-1,yshift=-3em] (m11) {$m_1$};
    \node [above=of m-1-2,yshift=-3em] (m12) {$m_2$};
    \node [above=of m-1-3,yshift=-2.5em] (m13) {$\cdots$};
    \node [above=of m-1-4,yshift=-3em] (m14) {$m_{r}$};
    \node [left=of m-1-1,xshift=2em] (m11) {$s_1$};
    \node [left=of m-2-1,xshift=2em] (m11) {$s_2$};
    \node [left=of m-3-1,xshift=1em] (m11) {$\vdots$};
    \node [left=of m-4-1,xshift=2em] (m11) {$s_{t}$};
\end{tikzpicture}},
\]
\pause
其中
\begin{equation*}
 C_{p q}= A_{p 1}  B_{1 q}+ A_{p 2}  B_{2 q}+\cdots+ A_{p l}  B_{l{q}}=\sum_{k=1}^{l}  A_{p k}  B_{k q}, \quad p=1,2, \cdots, t ; q=1,2, \cdots, r . \tag{4}
\end{equation*}

\end{frame}

\begin{frame}
  可以把 (3) 等号右边当作分块矩阵乘法的定义。
  (3) 的正确性可由矩阵乘积的定义直接验证即得， 就不详细说明了（粗略解释下）。
  应该注意，在对$A, B$分块时矩阵 $ A$ 的列的分法必须与矩阵 $ B$ 的行的分法一致。
  \pause
  $2\times 2$分块是常用的。此时乘法为
\[
        \begin{pmatrix}
            A & B\\
            C & D
        \end{pmatrix}
        \begin{pmatrix}
            A' & B'\\
            C' & D'
        \end{pmatrix}
    = 
        \begin{pmatrix}
            AA' + BC' & AB'+BD'\\
            CA'+DC' & CB'+DD'
        \end{pmatrix}.
  \]

  \pause
以下会看到，分块乘法有许多方便之处。 常常在分块之后，矩阵间相互的关系看得更清楚。
实际上，分块的记号我们已多次使用。
\pause
例如我们已意识到矩阵左乘行向量得到的是其行的线性组合，矩阵右乘列向量得到的是其列的线性组合：
    \begin{align*}
        (a_1,a_2,\cdots,a_s)\begin{pmatrix}
          \alpha_1\\ \alpha_2 \\\vdots \\ \alpha_s
      \end{pmatrix}&= a_1\alpha_1+a_2\alpha_2+\cdots + a_s\alpha_s,\\
            \begin{pmatrix}
          \beta_1 & \beta_2 & \cdots &\beta_n
        \end{pmatrix}\begin{pmatrix}
          b_1 \\ b_2 \\ \vdots \\ b_n
        \end{pmatrix}&= b_1\beta_1 + b_2\beta_2+ \cdots + b_n\beta_n,
    \end{align*}
    其中$a_i, b_j\in P$, $\alpha_i$是矩阵$A\in P^{s\times n}$的第$i$行给出的行向量，$\beta_j$是$A$的第$j$列给出的列向量。  
\pause
这里我们就用过矩阵分块运算的想法。
\end{frame}

\begin{frame}
而在证明关于矩阵乘积的秩的定理时，
我们用 $ B_{1},  B_{2}, \cdots,  B_{m}$ 表示 $ B$ 的行向量，于是
就有
\[
   A  B=  \begin{pmatrix}
    a_{11} & a_{12} & \cdots & a_{1m} \\
    a_{21} & a_{22} & \cdots  & a_{2m} \\
    \vdots & \vdots & & \vdots \\
    a_{n1} & a_{n2} & \cdots & a_{nm} 
  \end{pmatrix} \begin{pmatrix}
     B_{1} \\
   B_{2} \\
\vdots \\
 B_{m}
\end{pmatrix}
\pause
=\begin{pmatrix}
    a_{11}  B_{1}+a_{12}  B_{2}+\cdots+a_{1 m}  B_{m} \\
  a_{21}  B_{1}+a_{22}  B_{2}+\cdots+a_{2 m}  B_{m} \\
\cdots \cdots \cdots \\
a_{n 1}  B_{1}+a_{n 2}  B_{2}+\cdots+a_{n n}  B_{m}
\end{pmatrix} .
\]
\pause
用这个式子很容易看出 $A B$ 的行向量组是 $B$ 的行向量组的线性组合; 将 $A B$ 进行另一种分块乘法，从结果中可容易看出 $A B$ 的列向量组是 $A$ 的列向量组的线性组合。% (读者自己做一下)。

\pause
  我们也可定义分块矩阵的加法、数乘与转置，同样地能给出正确的 (忘记分块时的) 
  计算结果。
  以$2\times 2$分块为例：
\[
    \begin{gathered}
    \begin{pmatrix}
        A & B\\
        C & D
    \end{pmatrix} + \begin{pmatrix}
        A' & B' \\ C' & D'
    \end{pmatrix} = \begin{pmatrix}
        A+A' & B+B' \\ C+C' & D+D'
    \end{pmatrix},\\
    k
    \begin{pmatrix}
        A & B\\ C& D
    \end{pmatrix} = \begin{pmatrix}
        k A & k B\\  kC & k D
      \end{pmatrix}, \quad
\begin{pmatrix}
        A & B\\ C& D
      \end{pmatrix}^{\rT} = \begin{pmatrix}
        A^{\rT} & C^{\rT}\\ B^{\rT}& D^{\rT}
      \end{pmatrix}.
\end{gathered}
\]
其中加法时要注意到我们也有分块一致性的要求：要让等号右边有意义，等号左边的两个矩阵的分法要完全一致。
\end{frame}

\begin{frame}
  \begin{example}
  我们来求矩阵
\[
   D=\begin{pmatrix}
        a_{11} & \cdots & a_{1 k} & 0 & \cdots & 0 \\
        \vdots & & \vdots & \vdots & & \vdots \\
      a_{k 1} & \cdots & a_{k k} & 0 & \cdots & 0 \\
    c_{11} & \cdots & c_{1 k} & b_{11} & \cdots & b_{1 r} \\
  \vdots & & \vdots & \vdots & & \vdots \\
c_{r 1} & \cdots & c_{r k} & b_{r 1} & \cdots & b_{r r}
\end{pmatrix}=\begin{pmatrix}
     A &  O \\
   C &  B
\end{pmatrix}
\]
的逆矩阵， 其中 $ A,  B$ 分别是 $k$ 阶和 $r$ 阶的可逆矩阵， $ C$ 是 $r \times k$ 矩阵， $ O$ 是 $k \times r$ 零矩阵。
\end{example}
\pause
\begin{solution}
  首先， 因为
\[
|D|=|A||B|,
\]
所以当 $ A,  B$ 可逆时， $ D$ 也可逆。设
\[
   D^{-1}=\begin{pmatrix}
         X_{11} &  X_{12} \\
         X_{21} &  X_{22}
    \end{pmatrix}.
\]
于是
\end{solution}
\end{frame}

\begin{frame}

\begin{solution}[续]
\[
  \begin{pmatrix}
         A &  O \\
         C &  B
    \end{pmatrix}\begin{pmatrix}
         X_{11} &  X_{12} \\
       X_{21} &  X_{22}
  \end{pmatrix}=\begin{pmatrix}
       E_{k} &  O \\
     O &  E_{r}
\end{pmatrix}
\]
其中 $ E_{k},  E_{r}$ 分别表示 $k$ 阶和 $r$ 阶单位矩阵。 
乘出并比较等式两边， 得
\[
  \left\{\begin{array}{l}
         A  X_{11}= E_{k}, \\
         A  X_{12}= O, \\
       C  X_{11}+ B  X_{21}= O, \\
     C  X_{12}+ B  X_{22}= E_{r} .
\end{array}\right.
\]
由第一、二式得
\[
X_{11}=A^{-1}, \quad X_{12}=A^{-1} O=O,
\]
代入第四式，得
\[
 X_{22}= B^{-1},
\]
代入第三式，得
\[
 B  X_{21}=- C  X_{11}=- C  A^{-1}, \quad  X_{21}=- B^{-1}  C A^{-1}
\]
因此
\[
  D^{-1}=\begin{pmatrix}
        A^{-1} & O \\
        -B^{-1} C A^{-1} & B^{-1}
  \end{pmatrix} .
\]
\end{solution}
\end{frame}


\begin{frame}
特别地， 当 $ C= O$ 时， 有
\[
  \begin{pmatrix}
        A &  \\
         & B
    \end{pmatrix}^{-1}=\begin{pmatrix}
        A^{-1} &  \\
       & B^{-1}
  \end{pmatrix}.
\]

\pause
形为
\[
  \begin{pmatrix}
    a_{1} &  & &  \\
   & a_{2} & &  \\
& &\ddots &  \\
 &  & & a_{l}
\end{pmatrix}
\]
的矩阵，其中 $a_{i}$ ($i=1,2, \cdots, l$) 是数，通常称为\emph{对角矩阵}，
\pause
而形为
\[
  \begin{pmatrix}
     A_{1} & & &  \\
  & A_{2} & & \\
&  &\ddots&  \\
 & & & A_{l}
\end{pmatrix}
\]
的矩阵， 其中 $ A_{i}$ ($i=1,2, \cdots, l$) 是 $n_{i} \times n_{i}$ 矩阵， 通常称为\emph{准对角矩阵}。 当然， 准对角矩阵包括对角矩阵作为特殊情形。
\pause
类似地，我们有\emph{准上三角矩阵}和\emph{准下三角矩阵}的概念。
\end{frame}


\begin{frame}

对于两个有相同分块的准对角矩阵
\[
   A=\begin{pmatrix}
     A_{1} & & &  \\
  &  A_{2} & & \\
&&  \ddots & \\
 & & &  A_{l} 
\end{pmatrix}, \quad  B=\begin{pmatrix}
   B_{1} & & &  \\
&  B_{2} & \\
& & \ddots & \\
 & & &  B_{l}
\end{pmatrix},
\]
\pause
如果它们相应的分块是同阶的，那么显然有
\[
  AB=\begin{pmatrix}
    A_1 B_1 \\ & A_2B_2 \\ && \ddots \\ &&& A_lB_l
  \end{pmatrix},\quad
  A+B=\begin{pmatrix}
    A_1+ B_1 \\ & A_2 + B_2 \\ && \ddots \\ &&& A_l + B_l
  \end{pmatrix}.
\]
它们还是准对角矩阵。

\pause
其次，如果 $ A_{1},  A_{2}, \cdots,  A_{l}$ 都是可逆矩阵，那么
\[
  \begin{pmatrix}
     A_{1} & & &  \\
  &  A_{2} & & \\
& &\ddots & \\
 & & &   A_{l}
\end{pmatrix}^{-1}=\begin{pmatrix}
   A_{1}{ }^{-1} & & &  \\
&  A_{2}{ }^{-1} & & \\
& &\ddots & \\
 & &&   A_{l}^{-1}
\end{pmatrix} .
\]

\end{frame}

\begin{frame}{小结}

  \begin{enumerate}
    \item 何为矩阵的分块？
    \item 分块矩阵的乘法、加法、数乘、转置如何？乘法和加法如何要求分块的一致性？
    \item 一行向量左乘一矩阵得到何向量？一列向量右乘一矩阵得到何向量？
    \item 准对角阵何时可逆？求逆公式是？
  \end{enumerate}
  
\end{frame}
